Datasets cargados exitosamente:
Host: (21020, 13)
Property: (21020, 13)
Location: (21020, 7)
Conditions: (21020, 7)
Reviews: (21020, 16)
AirBnB Madrid - Optimización de Precios
Index
Contexto del Problema
Uno de nuestros clientes opera en el mercado de inmuebles. Está especialmente interesado en Madrid, donde posee una cantidad importante de viviendas publicadas en la plataforma AirBnB y nos pide que le asesoremos respondiendo a la siguiente pregunta:
¿Qué puedo hacer para optimizar el precio de mis viviendas?
Definición del Problema
Nuestro cliente busca mejorar el rendimiento económico de sus viviendas, identificando acciones que pueda aumentar el precio de sus alojamientos. Nuestro objetivo es analizar los factores que influyen en la fijación de los precios de Airbnb, mediante datos de propiedades de Airbnb en Madrid, y proporcionar una serie de estrategias prácticas basadas en datos, que permitan al cliente aumentar el precio de sus viviendas.
Roadmap del Proyecto
Carga y Exploración de Datos
Carga de Datasets
Para realizar el análisis, se han utilizado cinco datasets proporcionados por la plataforma AirBnB que contienen información relevante sobre los alojamientos en Madrid. Estos datasets incluyen detalles sobre los anfitriones, las propiedades, la ubicación, las condiciones de reserva y las reseñas de los huéspedes.
Descripción de Tablas
Los datos se componen de cinco tablas principales, cada una con un enfoque específico:
Host: Información sobre los anfitriones, incluyendo su antigüedad y verificación.
Localización: Datos geográficos de las propiedades, como barrio y coordenadas.
Propiedad: Detalles de las características de las viviendas, como tipo, número de habitaciones y amenidades.
Condiciones: Información sobre las condiciones de reserva, incluyendo precio, políticas de cancelación y mínimo de noches.
Reseñas: Historial de reseñas y puntuaciones otorgadas por los huéspedes.
| Dataset | Descripción | Variables_Clave |
|---|---|---|
| Host | Información del anfitrión (senority, verificado) | host_response_time |
| Localización | Ubicación geográfica (barrio, coordenadas, distancias) | neighbourhood |
| Propiedad | Características de la propiedad (tipo, habitaciones, amenidades) | property_type, amenities, bedrooms |
| Condiciones | Condiciones de reserva (precio, políticas de cancelación, mínimo de noches) | price, minimum_nights, cancellation_policy |
| Reseñas | Historial de reseñas (puntuaciones, cantidad, actividad) | number_of_reviews, review_scores_cleanliness |
Fusión de Datasets
Para llevar a cabo un análisis integral, se han fusionado los cinco datasets en un único DataFrame basado en la columna común ‘id’, que identifica de manera única cada propiedad.
Dataset fusionado: (21020, 52)
Transformación y filtrado de los datos
Se ha realizado un filtrado de los datos para centrarse únicamente en las viviendas que presentan características comparables a las de la cartera del cliente.
En la siguiente figura se observa el número de viviendas distribuidas en función del precio. Un número pequeño de viviendas tienen precios muy elevados, lo que puede distorsionar el análisis posterior. Por ello, se procede a eliminar los outliers de la variable objetivo (precio) utilizando el método del rango intercuartílico (IQR).
(13014, 52)
Antes del filtrado el número de viviendas que teníamos era de 21.020 viviendas, de las cuales 14.308 se ajustan a las características del cliente. Para poder ajustar mejor el análisis, se han eliminado los outliers de la variable objetivo (precio) quedándonos finalmente con 13.014 viviendas.
Aquí se puede observar la distribución del precio tras eliminar los outliers, quedando un rango de precios entre 10€ y 200€ aproximadamente, donde se concentra la mayoría de las viviendas y se llevarán a cabo los análisis posteriores.
Estadísticas Descriptivas
Los precios de las propiedades muestran una clara variedad. El precio promedio es de 67,58 €, mientras que la mediana es de 60 €, lo que indica que la mayoría de los alojamientos se concentran alrededor de ese valor. El rango va desde un mínimo muy bajo de 1 € hasta un máximo de 190 €, mostrando que hay tanto opciones muy económicas como otras mucho más caras. La desviación estándar de 37,60 € confirma que los precios están bastante dispersos y no siguen un valor típico muy marcado.
Al observar los percentiles, se ve que el 25% de las propiedades cuesta 38 € o menos, y el 75% no supera los 90 €, de modo que la mayor parte del mercado se mantiene en un nivel asequible. Solo un pequeño grupo, el 5% superior, supera los 147 €. En conjunto, la distribución muestra un mercado con una base amplia de precios bajos y medios, y una minoría de alojamientos más costosos que elevan el extremo superior de la distribución.
ESTADÍSTICAS DEL PRECIO:
Precio promedio: €67.58
Precio mediano: €60.00
Precio mínimo: €1.00
Precio máximo: €190.00
Desviación estándar: €37.60
Distribución de precios:
25% de propiedades: ≤ €38.00
50% de propiedades: ≤ €60.00
75% de propiedades: ≤ €90.00
95% de propiedades: ≤ €147.00
Análisis Exploratorio
Variables Clave del Estudio
Para estructurar el análisis, se agrupan las variables en cuatro bloques principales:
Localización
Barrio
Distrito
Características de la Propiedad
Tipo de propiedad
Número de habitaciones
Amenidades (WiFi, TV, aire acondicionado, etc.)
Condiciones y Normativas
- Política de cancelación
- Mínimo de noches
Historial y Reseñas
- Número de reseñas de limpieza
Análisis por Ubicación
La gráfica muestra que la oferta de viviendas está muy concentrada en unos pocos barrios, especialmente en Centro y Embajadores, que destacan con mucha diferencia respecto al resto. Centro supera ampliamente las 3.000 propiedades, mientras que Embajadores se sitúa ligeramente por debajo. En contraste, barrios como Malasaña, La Latina, Arganzuela o Chamberí tienen una cantidad de alojamientos mucho más reducida, generalmente entre 400 y 600 propiedades. Esta concentración indica que la mayor parte del mercado turístico se ubica en zonas altamente demandadas por visitantes, mientras que el resto de barrios tienen una presencia menos masiva en la plataforma.
Al comparar esta oferta con los barrios más caros, se observa que el precio no está directamente relacionado con el volumen de propiedades. Zonas como Recoletos, Hispanoamérica, El Viso o Castellana —que no aparecen entre los barrios con mayor número de viviendas— presentan los precios promedio más altos, todos por encima de los 90 €. Estos barrios tienen menos propiedades disponibles, pero pertenecen a zonas residenciales de alto nivel, lo que explica sus precios elevados. Por el contrario, Centro, a pesar de ser el barrio con más oferta, no está entre los más caros, lo que indica que la elevada competencia probablemente modera los precios.
BARRIOS MÁS CAROS (Precio Promedio):
1. Recoletos: €100.36 (69 propiedades)
2. Hispanoamérica: €98.69 (32 propiedades)
3. El Tréntaiseis: €94.33 (6 propiedades)
4. El Viso: €92.06 (18 propiedades)
5. Castellana: €90.32 (38 propiedades)
6. Almagro: €85.88 (48 propiedades)
7. Sol: €85.86 (374 propiedades)
8. Nueva España: €84.17 (12 propiedades)
9. Goya: €83.50 (102 propiedades)
10. Argüelles: €82.97 (126 propiedades)
Visualización agregado por Barrio
En el siguiente mapa se visualiza las viviendas agregados por barrio, donde se puede obtener un análisis geoespacial de los precios medios y la cantidad de propiedades disponibles en cada barrio de Madrid.
Características del Mapa de Barrios
Color de la burbuja:
Rojo: Barrios con los precios de propiedades más altos.
Verde: Barrios con los precios de propiedades más bajos.
Tamaño de la burbuja: Representa la cantidad de propiedades disponibles en cada barrio.
Matriz de Correlaciones
La siguiente matriz de correlación muestra las relaciones entre las variables numéricas más relevantes del dataset. Se han seleccionado las 8 variables que presentan una mayor correlación absoluta con el precio, para entender mejor qué factores podrían influir en la fijación de los precios de las viviendas.
Las variables más correlacionadas con el precio son el número de camas (beds) y la capacidad de alojamiento (accommodates), lo que indica que a medida que aumenta la capacidad de la vivienda, también tiende a aumentar su precio. Además, la presencia de aire acondicionado (air_conditioning) también muestra una correlación positiva con el precio, sugiriendo que las propiedades que ofrecen esta amenidad suelen tener precios más altos. Estos hallazgos resaltan la importancia de las características físicas y comodidades de las viviendas en la determinación de sus precios en el mercado de Airbnb.
Análisis de Reseñas y Calificaciones
La siguiente figura muestra que el precio promedio de las viviendas se mantiene notablemente estable a través de todos los rangos de número de reseñas, con variaciones mínimas entre categorías que oscilan alrededor de los 67–69 euros. Esta uniformidad sugiere, de manera bastante clara, que la cantidad de reviews no ejerce una influencia significativa sobre el precio, lo que transmite la idea de un mercado donde el valor del producto permanece relativamente constante independientemente de su nivel de popularidad o exposición.
En cuanto a las reseñas de limpieza, se observa una ligera tendencia ascendente en el precio promedio a medida que aumentan las puntuaciones de limpieza. Las propiedades con puntuaciones más altas tienden a tener precios ligeramente superiores, alcanzando un máximo alrededor de los 70 euros para las puntuaciones más elevadas. Aunque la variación no es drástica, esta tendencia sugiere que una mejor percepción de la limpieza puede contribuir a justificar precios marginalmente más altos, reflejando la importancia que los huéspedes otorgan a este aspecto en su experiencia de alojamiento.
ESTADÍSTICAS DE RESEÑAS:
Promedio de reseñas: 45.1
Mediana de reseñas: 15.0
Propiedades sin reseñas: 1613 (12.4%)
Hipótesis a Validar
1. La presencia de amenities clave como aire acondicionado, televisión, calefacción, cocina o conexión a internet aumenta el precio de las viviendas.
2. El número de habitaciones impacta en el precio de las viviendas.
3. Reducir el número mínimo de noches de estancia sube el precio de las viviendas.
4. Con una política de cancelación más flexible el precio de la vivienda aumenta.
5. Si aumento el servicio de limpieza las reseñas de limpieza potencialmente subirán por ende el precio aumentará.
Análisis de Hipótesis
Hipótesis 1: Amenities y Precio
Planteamiento: La presencia de amenities clave como aire acondicionado, televisión, calefacción, cocina o conexión a internet aumenta el precio de las viviendas.
En las siguientes figuras se muestran boxplots que representan la distribución de precios de las viviendas en función de la presencia o ausencia de ciertas amenities clave. Cada caja representa la distribución de precios para viviendas que cuentan con la amenidad (Sí) y aquellas que no la tienen (No). A su vez, se indica el p-valor del test estadístico (t-test o ANOVA) para evaluar si las diferencias en precios entre los dos grupos son estadísticamente significativas.
Las viviendas con Wifi no muestran un diferencia significativa en terminos de precio medio en comparación con aquellas que lo tienen, ambas tienen un precio medio de 60€ la noche, por lo que la instalación del wifi no es clave para la optimización del precio de la vivienda.
En este caso la diferencia de precio medio entre viviendas con TV (69€ la noche) y sin TV (35€ la noche) es sigifificativa, por lo que la instalación de una TV en la vivienda puede ser una buena estrategia para optimizar el precio medio del alojamiento.
Al igual que con la TV, las viviendas que disponen de aire acondicionado tienen un precio medio significativamente mayor (71€ la noche) en comparación con aquellas que no lo tienen (40€ la noche). Por lo tanto, la instalación de aire acondicionado puede ser una estrategia efectiva para aumentar el precio medio del alojamiento.
Con este amenitie ocurre lo mismo que anteriormente, las viviendas que disponen de calefacción tienen un precio medio significativamente mayor (64€ la noche) en comparación con aquellas que no lo tienen (40€ la noche). Por lo tanto, la instalación de calefacción puede ser una estrategia efectiva para aumentar el precio medio del alojamiento.
La cocicna es otro de los amenities que impacta positivamente en el precio medio del alojamiento. Aquellas viviendas que disponen de cocina tienen un precio medio significativamente mayor (65€ la noche) en comparación con aquellas que no lo tienen (35€ la noche). Por lo tanto, la instalación de una cocina puede ser una estrategia efectiva para aumentar el precio medio del alojamiento.
Conclusión de Hipótesis 1
Hallazgos clave:
- Instalación de amenities: TV, aire acondicionado, calefacción y cocina aumentan significativamente el precio medio.
Analizando los datos de amenities se puede oservar que aquellas como que la vivienda incluya TV, aire acondicionado, calefaccion o cocina tienen un precio medio mayor que aquellas viviendas que no las incluyen. Sin embargo, la instalación de Wifi no es estadisticamente significativa en el precio, por lo que la isntalación de wifi no deberia de ser prioritaria a la hora de aumentar el precio de un alojamiento.
Hipótesis 2: Número de Habitaciones y Precio
Planteamiento: El número de habitaciones impacta en el precio de las viviendas.
En la siguiente figura se ve reflejado el número de habtaciones (entre 1 y 3 habitaciones) y su relación con el precio medio del alojamiento. Cada caja representa la distribución de precios para cada número de habitaciones que contenga la vivienda, incluyendo mediana, cuartiles y posibles outliers. A su vez, se indica el p-valor del test estadístico (ANOVA) para evaluar si las diferencias en precios entre los distintos grupos son estadísticamente significativas.
En figura se observa que la mediana de los precios aumenta significativamente al pasar de 1 a 2 habitaciones (de 60€ a 75€ la noche). Sin embargo, al aumentar de 2 a 3 habitaciones, el incremento en la mediana del precio es mucho menor (de 75€ a 80€ la noche). Por lo tanto, se puede deducir que el nñumero óptimoi de habitaciones, en este rango, es de 2, de manera que se maxima el precio medio ndel alojamiento.
Conclusión de Hipótesis 2
Hallazgos clave:
Incremento 1→2 habitaciones: Aumento de precio significativo.
Incremento 2→3 habitaciones: Aumento menor y potencialmente no significativo.
Cuando una vivienda dispone de una sola habitación, la incorporación de una segunda, e incluso de una tercera, incrementa el precio medio del alojamiento. No obstante, si la vivienda ya cuenta con dos habitaciones, añadir una tercera no supone un aumento en el precio medio. Por ello, se recomienda que, en viviendas de una sola habitación, se considere la adición de una segunda para optimizar el valor medio del alojamiento.
Hipótesis 3: Noches Mínimas y Precio
Planteamiento: Reducir el número mínimo de noches de estancia sube el precio de las viviendas.
En la siguiente figura se ve reflejado el número mínimo de noches (entre 1 y 7 noches) y su relación con el precio medio del alojamiento. Cada caja representa la distribución de precios para cada número mínimo de noches, incluyendo mediana, cuartiles y posibles outliers. A su vez, se indica el p-valor del test estadístico (ANOVA) para evaluar si las diferencias en precios entre los distintos grupos son estadísticamente significativas.
Como se puerde observar en la figura, la mediana los precios entre 1 y 2 dos noches (51€ y 65€ la noche) es relativamente baja en comparación con la mediana de las propiedades que requieren un mínimo de 3 o 4 noches (80€ y 90€ la noche). Conforme van aumentando las noches mínimas (entre 5 y 7 noches) el precio medio de las propiedades tiende a disminuir ligeramente (75€ y 70€ la noche). Esto podría deberse a que las propiedades que requieren un mayor número de noches mínimas suelen ser más económicas para atraer reservas más largas, por lo que eservas de muchas noches no necesariamente generan precios más altos
Conclusión de Hipótesis 3
Hallazgos clave:
- Propiedades con 3-4 noches mínimas tienen precios superiores al resto del número de noches mínimas.
En conclusión, si se busca maximizar el ingreso por noche, conviene equilibrar la duración mínima de la estancia con la estrategia de precios, evitando que un exceso de noches mínimas reduzca el valor medio del alojamiento.
Hipótesis 4: Política de Cancelación
Planteamiento: Con una política de cancelación más flexible el precio de la vivienda aumenta.
En la siguiente figura se ve reflejado los distintos tipos de políticas de cancelación y su relación con el precio medio del alojamiento. Cada caja representa la distribución de precios para cada tipo de política de cancelación, incluyendo mediana, cuartiles y posibles outliers. A su vez, se indica el p-valor del test estadístico (ANOVA) para evaluar si las diferencias en precios entre los distintos grupos son estadísticamente significativas.
Se observa en la figura que aquellas viviendas que disponen de una política de cancelación super estricta de 30 días tienen un precio medio significativamente más alto (120€ la noche) en comparación con las políticas de cancelación más flexibles, como la política flexible (65€ la noche) o moderada (75€ la noche). Sin embargo, aquellas que tienen un apolítica super estricta de 60 días, su precio medio es el más bajo de todos (52€ la noche). Esto sugiere que los anfitriones que ofrecen políticas de cancelación más estrictas pueden justificar precios más altos, posiblemente debido a la percepción de mayor compromiso por parte de los huéspedes, pero que una política excesivamente estricta puede disuadir a potenciales huéspedes, resultando en precios más bajos.
Conclusión de Hipótesis 4
Hallazgos clave:
Política estricta: Propiedades con cancelación superestricta tienen precios altos.
Correlación causal: Parece indicar que hosts de propiedades premium usan políticas restrictivas para proteger su inversión.
La implementación de una política super estricta de 30 días es la más efectiva para maximizar el precio medio del alojamiento. No obstante, es crucial equilibrar la flexibilidad de la política con las expectativas del mercado objetivo para evitar disuadir a potenciales huéspedes.
Hipótesis 5: Reseñas de Limpieza
Planteamiento: Si aumento el servicio de limpieza las reseñas de limpieza potencialmente subirán por ende el precio aumentará.
La siguente figura muestra un boxplot que representa la distribución de precios de las viviendas en función de las calificaciones de limpieza recibidas en las reseñas. Cada caja representa la distribución de precios para cada nivel de calificación de limpieza, incluyendo mediana, cuartiles y posibles outliers.
En la figura se observa que las propiedades con calificaciones de limpieza más altas (9-10) tienden a tener precios medios más altos (alrededor de 85-90€ la noche) en comparación con aquellas con calificaciones más bajas (6-7), que tienen precios medios significativamente más bajos (alrededor de 50-60€ la noche). Sin embargo, las viviendas que tienen calificaciones de 2 tienen un precio medio de 58€ la noche, similar a las de 9 o 10, por lo que hace falta un análisis más profundo para entender este comportamiento atípico.
En la figura se observa el número de viviendas en función de la calificación de limpieza. Un total de 6285 tienen una calificación de limpieza de 10, siendo la mayoría de las viviendas. A medida que la calificación disminuye, el número de viviendas también disminuye, con solo 31 viviendas que tienen una calificación de limpieza de 2. Por lo tanto, la mediana de precio de las viviendas con calificación de limpieza de 2 puede estar sesgada debido al bajo número de viviendas en esa categoría. De esta manera, se puede concluir que una mejor calificación de limpieza está asociada con precios más altos.
Conclusión de Hipótesis 5
Hallazgos clave:
- Precio vs Limpieza: Mejores calificaciones de limpieza correlacionan con precios más altos.
Esto sugiere que una mejor percepción de la limpieza por parte de los huéspedes puede justificar precios más altos, posiblemente debido a la mayor satisfacción del cliente y la disposición a pagar más por una experiencia de alojamiento percibida como más limpia y cómoda.
Recomendaciones
Estrategias de Optimización de Precios
| Estrategia | Acción_Específica | Inversión_Requerida |
|---|---|---|
| Adición de Amenities | Añadir WiFi, TV, aire acondicionado, calefacción, o cocina en propiedades básicas | Media - Tiempo y mejoras servicio |
| Adición de Habitaciones | Propiedas con 1 habitación: añadir habitaciones adicionales | Alta - Instalaciones físicas |
| Ajuste de Noches Mínimas | Ajustar mínimo de noches a 3-4 para maximizar precio medio | Baja - Ajuste de noches |
| Políticas de Cancelación | Implementar política estricta en las propiedades | Baja - Cambio de políticas |
| Gestión de la limpieza | Aumentar la calidad del servicio de limpieza para mejorar reseñas | Media - Mejora de procesos y seguimiento |
Desarrollo de recomendaciones
Priorizar la instalación de una TV, aire acondicionado, cocina completa y calefacción en propiedades nuevas. El WiFi es imprescindible pero no diferenciador.
Entre todas las amenities mencionadas que pueden ser una buena estrategia para aumentar el precio medio del alojamiento, se recomienda colocar una TV primero ya que puede ser la opción más económica y con mayor impacto en el precio medio. Posteriormente, se recomienda instalar aire acondicionado, cocina completa y calefacción, en función del presupuesto disponible.
Si una propiedad tiene 1 habitación, invertir en la división/reforma para crear 2 habitaciones es altamente rentable. Pasar de 2 a 3 habitaciones tiene menor rentabilidad.
En las viviendas que se dispongo de una sola habitación, es altamente recomendado invertir en la creación de una segunda habitación, ya que esto incrementa significativamente el precio medio del alojamiento. Sin embargo, si la vivienda ya cuenta con dos habitaciones, añadir una tercera no supone un aumento significativo en el precio medio, por lo que se debe evaluar cuidadosamente la rentabilidad de dicha inversión.
Ajustar el mínimo de noches a 3-4 para maximizar precio medio, evitando valores extremos (1 noche o >5 noches).
Se debe ajustar el mínimo de noches para poder obtener un equilibrio entre la duración de la estancia y la estrategia de precios. Se recomienda establecer un mínimo de noches entre 3 y 4, ya que esto maximiza el precio medio del alojamiento. Evitar establecer un mínimo de 1 noche o más de 5 noches, ya que estos extremos pueden reducir el valor medio del alojamiento.
Ajustar la política de cancelación según el tipo de propiedad.
La implementeación de una política de cancelación debe de ser considerada en función de la propiedad y sus características. Para propiedades premium o nuevas, se recomienda implementar una política estricta de cancelación, ya que esto permite justificar precios más altos. Por otro lado, para propiedades estándar o competitivas, se recomienda utilizar políticas de cancelación moderadas o flexibles, ya que mantiene un precio competitivo y maximiza la ocupación. Aun así, este indicador debe de ser estudiado en conjunto con otros factores para determinar la mejor estrategia de precios, ya que se puede deber a que viviendas premium utilizan políticas restrictivas para proteger su inversión.
Mejorar la calidad del servicio de limpieza para obtener mejores reseñas y justificar precios más altos.
Las viviendas que reciben mejores calificaciones de limpieza tienden a tener precios medios más altos. Por lo tanto, se recomienda invertir en mejorar la calidad del servicio de limpieza, ya sea mediante la contratación de personal adicional, la implementación de estándares más rigurosos o la utilización de productos de limpieza de alta calidad puede resultar en mejores reseñas por parte de los huéspedes, lo que a su vez justifica precios más altos y mejora la reputación del alojamiento.
Conclusión
En conclusión, las estrategias recomendadas se centran en mejorar las características y servicios ofrecidos por las propiedades para maximizar el precio medio del alojamiento. La implementación de estas recomendaciones debe ser evaluada cuidadosamente en función del presupuesto disponible, el tipo de propiedad y las expectativas del mercado objetivo para asegurar una optimización efectiva del valor del alojamiento.